科普一下,什么是gpu算力?

您所在的位置:网站首页 560 算力 科普一下,什么是gpu算力?

科普一下,什么是gpu算力?

#科普一下,什么是gpu算力?| 来源: 网络整理| 查看: 265

算力字面意义就是计算能力。但是计算有很多,比如浮点计算、整数计算、超越函数计算等等,浮点计算还有双精度计算、单精度计算,整数也一样。所以通俗来讲,算力就是单位时间内硬件能够完成某种运算的量。

为什么需要区分不同种类的计算呢?因为在硬件上针对不同的计算有不同的计算单元,比如单精度浮点计算有专门的浮点运算单元,超越函数如果有硬件加速,也有相应的硬件单元,整型计算也有相应的硬件单元。因此同一设备上,不同的计算类型,算力是不同的。以浮点单元算力为例,一般浮点算力的单位为 GFLOPS/s、TFLOPS/s, 1 FLOP 是指一次乘法或者一次加法,1 GFLOPS 是 1024/1000 FLOPS。因此无论是 CPU 还是 GPU其算力概念并无差异,仅仅是计算资源不同而已。以 Arm A76 为例,其拥有 2 条 128 bit FMA pipeline,因此其算力为 2 x 4 x 2 x 频率, 第一个 2 是 2 条 pipeline,第二个 4 是 128-bit 为4 个 32-bit 浮点,最后一个 2 是 FMA 是乘加计算,因此一条 FMA 是 2 FLOPS。所以 A76 的算力是 16 x 频率。

那么对于 GPU 是否也是这样呢?理论是没有错的,只是在具体问题需要具体分析一下,例如 Qualcomm 的 Adreno,Arm 的 Mali 这样的 GPU,其浮点计算只能由浮点计算单元完成,因此其算力与 CPU 一样,由其浮点计算单元的吞吐乘以频率计算。但是对于 NVIDIA 的 GPU,则有所不同,其在 Volta 架构开始引入 Tensor Core,该硬件单元支持 FP16 精度的 4x4 矩阵乘加指令,HMMA,也就是说一条指令可以完成 128 FLOPs 的计算(64次乘法,64次加法),那么,该硬件的峰值就是浮点计算单元算力 + Tensor Core的算力。以上是关于硬件算力的简单描述,也指硬件的峰值算力,但是在实际应用中是否能达到硬件峰值算力,则会受更多因素的影响。

有兴趣可以参考大佬文章,了解更多关于峰值的内容

参考资料:



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3